Mô hình hồi quy là gì? Các công bố khoa học về Mô hình hồi quy

Mô hình hồi quy là một phương pháp trong thống kê và máy học để dự đoán giá trị của một biến phụ thuộc dựa trên nhiều biến độc lập. Mô hình hồi quy giả định một...

Mô hình hồi quy là một phương pháp trong thống kê và máy học để dự đoán giá trị của một biến phụ thuộc dựa trên nhiều biến độc lập. Mô hình hồi quy giả định một mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập và cố gắng tìm ra một hàm số tối ưu để ánh xạ các biến độc lập vào biến phụ thuộc.

Mô hình hồi quy có thể được áp dụng cho các loại dữ liệu liên tục hoặc rời rạc và có thể được sử dụng để dự đoán giá trị trong tương lai hoặc giải thích mối quan hệ giữa các biến. Các phương pháp hồi quy phổ biến bao gồm hồi quy tuyến tính, hồi quy logistic, hồi quy đa thức và hồi quy thần kinh mạng.
Mô hình hồi quy đặt mục tiêu là tìm ra mối quan hệ tuyến tính giữa biến phụ thuộc (y) và các biến độc lập (x₁, x₂, ..., xn). Phương pháp này dựa trên giả định rằng mối quan hệ này có thể được biểu diễn bằng một phương trình tuyến tính của các biến độc lập.

Phương trình hồi quy đơn giản nhất là hồi quy tuyến tính. Dạng chung của phương trình hồi quy tuyến tính là:

y = β₀ + β₁x₁ + β₂x₂ + ... + βₙxn

Trong đó:
- y là biến phụ thuộc cần dự đoán.
- x₁, x₂, ..., xn là các biến độc lập được sử dụng để dự đoán y.
- β₀, β₁, β₂, ..., βₙ là các hệ số hồi quy, thể hiện mức độ ảnh hưởng của từng biến độc lập đến biến phụ thuộc.

Mục tiêu của mô hình hồi quy là tìm ra các hệ số hồi quy (β₀, β₁, β₂, ..., βₙ) sao cho phương trình tối ưu hóa khả năng dự đoán của mô hình. Quá trình này thường được thực hiện bằng cách sử dụng các phương pháp như tối thiểu hóa sai số bình phương nhỏ nhất (Least Squares), lập trình tuyến tính, gradient descent và nhiều phương pháp khác.

Có nhiều biến thể khác nhau của mô hình hồi quy như hồi quy đa thức (khi thêm các biến lên mũ khác nhau), hồi quy logistic (cho biến phụ thuộc có giá trị rời rạc), hồi quy ridge (giảm thiểu overfitting) và hồi quy Lasso (điều chỉnh tỷ lệ ảnh hưởng của các biến độc lập).
Mô hình hồi quy tuyến tính là một phương pháp dự đoán giá trị của biến phụ thuộc dựa trên một hoặc nhiều biến độc lập. Mô hình này dựa trên giả định rằng có một mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập.

Phương trình hồi quy tuyến tính có dạng:

y = β₀ + β₁x₁ + β₂x₂ + ... + βₙxn

Trong đó:
- y là biến phụ thuộc cần được dự đoán.
- x₁, x₂, ..., xn là các biến độc lập.
- β₀, β₁, β₂, ..., βₙ là các hệ số hồi quy, biểu diễn mức độ ảnh hưởng của từng biến độc lập đến biến phụ thuộc.

Mục tiêu của mô hình hồi quy tuyến tính là tìm ra các giá trị của β₀, β₁, β₂, ..., βₙ sao cho mô hình hồi quy có khả năng dự đoán tốt nhất. Để làm được điều đó, ta cần sử dụng các phương pháp ước lượng hệ số, như phương pháp tối thiểu hóa sai số bình phương nhỏ nhất (Least Squares Method), phương pháp các đặc trưng tiêu biểu (Stepwise Feature Selection Method) hoặc các phương pháp tối ưu hóa khác.

Ngoài phương trình hồi quy tuyến tính đơn giản, còn có thể sử dụng các biến độc lập với dạng đa thức, tức là biến được tăng lên mũ. Ví dụ, ta có thể thêm các biến x₁², x₁³, ... vào phương trình để khám phá mối quan hệ phi tuyến. Điều này giúp mô hình hồi quy tuyến tính linh hoạt hơn và có thể xấp xỉ tốt hơn với môi trường dữ liệu thực tế.

Mô hình hồi quy tuyến tính cũng có thể được sử dụng cho dữ liệu không chỉ có biến phụ thuộc liên tục mà còn có biến phụ thuộc rời rạc. Khi biến phụ thuộc là các giá trị rời rạc, ta có thể sử dụng mô hình hồi quy logistic để dự đoán xác suất xảy ra của một sự kiện, với giá trị dự đoán nằm trong khoảng từ 0 đến 1.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề mô hình hồi quy:

Hồi quy trọng số theo địa lý: Một phương pháp khám phá tính không ổn định không gian Dịch bởi AI
Geographical Analysis - Tập 28 Số 4 - Trang 281-298 - 1996
Tính không ổn định không gian là điều kiện mà một mô hình "toàn cầu" đơn giản không thể giải thích các mối quan hệ giữa một số tập hợp biến. Bản chất của mô hình phải thay đổi theo không gian để phản ánh cấu trúc bên trong dữ liệu. Trong bài báo này, một kỹ thuật được phát triển, được gọi là hồi quy trọng số theo địa lý, nhằm cố gắng nắm bắt sự biến đổi này bằng cách điều chỉnh một mô hình...... hiện toàn bộ
#tính không ổn định không gian #hồi quy trọng số theo địa lý #mô hình hồi quy đa biến #kiểm tra thống kê
Kiểm Tra Mediation và Suppression Effects của Các Biến Tiềm Ẩn Dịch bởi AI
Organizational Research Methods - Tập 11 Số 2 - Trang 296-325 - 2008
Do tầm quan trọng của các nghiên cứu trung gian, các nhà nghiên cứu đã liên tục tìm kiếm phương pháp thống kê tốt nhất cho hiệu ứng trung gian. Các phương pháp thường được sử dụng bao gồm phân tích tương quan bậc không (zero-order correlation) và tương quan từng phần (partial correlation), các mô hình hồi quy phân cấp (hierarchical regression models), và mô hình phương trình cấu trúc (SEM...... hiện toàn bộ
#hiệu ứng trung gian #biến tiềm ẩn #mô hình phương trình cấu trúc #khoảng tin cậy bootstrap #phân tích hồi quy
Suy ngẫm lại một số khía cạnh của mô hình phương trình cấu trúc hồi quy bậc thấp Dịch bởi AI
European Journal of Marketing - Tập 53 Số 4 - Trang 566-584 - 2019
Mục đíchMô hình phương trình cấu trúc hồi quy bậc thấp (PLS-SEM) là một kỹ thuật thống kê quan trọng trong bộ công cụ các phương pháp mà các nhà nghiên cứu trong lĩnh vực tiếp thị và các khoa học xã hội khác thường xuyên sử dụng trong các phân tích thực nghiệm của họ. Mục đích của bài báo này là làm rõ một số hiểu lầm đã xuất hiện do các "hướng dẫn mới" đ...... hiện toàn bộ
#PLS-SEM #mô hình phương trình cấu trúc #nghiên cứu thực nghiệm #phân tích dữ liệu #khái niệm khung phương pháp
Tính chất của các bài kiểm tra phụ thuộc không gian trong mô hình hồi quy tuyến tính Dịch bởi AI
Geographical Analysis - Tập 23 Số 2 - Trang 112-131 - 1991
Dựa trên một số lượng lớn các thí nghiệm mô phỏng Monte Carlo trên một mạng lưới đều đặn, chúng tôi so sánh các tính chất của kiểm tra Moran's I và kiểm tra nhân tử Lagrange đối với phụ thuộc không gian, tức là đối với cả tự tương quan lỗi không gian và biến phụ thuộc được suy rộng không gian. Chúng tôi xem xét cả độ chệch và sức mạnh của các bài kiểm tra cho sáu cỡ mẫu, từ hai mươi lăm đế...... hiện toàn bộ
#Moran's I #nhân tử Lagrange #phụ thuộc không gian #tự tương quan lỗi #trễ không gian #ma trận trọng số không gian #mô phỏng Monte Carlo #mô hình hồi quy tuyến tính #hiệu ứng ranh giới
Thái độ So Với Thói Quen Chung: Các Yếu Tố Quyết Định Lựa Chọn Phương Thức Di Chuyển1 Dịch bởi AI
Journal of Applied Social Psychology - Tập 24 Số 4 - Trang 285-300 - 1994
Một mô hình lựa chọn phương thức di chuyển được thử nghiệm thông qua một cuộc khảo sát trên 199 cư dân của một ngôi làng. Hành vi lựa chọn ô tô cho một chuyến đi cụ thể được dự đoán từ thái độ đối với việc lựa chọn ô tô và thái độ đối với việc lựa chọn một phương thức thay thế (tức là, tàu), một mặt, và từ thói quen sử dụng ô tô tổng quát, mặt khác. Không giống như các biện pháp truyền thố...... hiện toàn bộ
#lựa chọn phương thức di chuyển #thái độ #thói quen #hành vi #mô hình dự đoán
Ước Lượng Các Mô Hình Hồi Quy Trong Đó Biến Phụ Thuộc Dựa Trên Các Ước Tính Dịch bởi AI
Political Analysis - Tập 13 Số 4 - Trang 345-364 - 2005
Các nhà nghiên cứu thường sử dụng các đại lượng ước lượng từ các tập dữ liệu hỗ trợ làm biến phụ thuộc. Các mô hình biến phụ thuộc ước lượng (EDV) xuất hiện, chẳng hạn, trong các nghiên cứu khi đơn vị phân tích là các quận hoặc bang và biến phụ thuộc là một giá trị trung bình ước lượng, tỷ lệ, hoặc hệ số hồi quy. Các học giả khi điều chỉnh mô hình EDV thường nhận thức rằng độ biến thiên tr...... hiện toàn bộ
Kiểm định độ vừa vặn cho mô hình hồi quy logistic được ước lượng bằng dữ liệu mẫu khảo sát Dịch bởi AI
Stata Journal - Tập 6 Số 1 - Trang 97-105 - 2006
Sau khi mô hình hồi quy logistic được ước lượng, cần thực hiện một kiểm định tổng thể về độ vừa vặn của mô hình kết quả. Một kiểm định thường được sử dụng để đánh giá độ vừa vặn của mô hình là kiểm định Hosmer–Lemeshow, có sẵn trong Stata và hầu hết các phần mềm thống kê khác. Tuy nhiên, thường thì người ta quan tâm đến việc ước lượng mô hình hồi quy logistic cho dữ liệu khảo sát mẫu, chẳ...... hiện toàn bộ
Nồng độ chlorophyll, vật chất lơ lửng và gelbstoff trong các vùng nước loại II được suy diễn từ dữ liệu máy quét màu vùng ven biển vệ tinh bằng phương pháp mô hình hồi quy ngược Dịch bởi AI
American Geophysical Union (AGU) - Tập 99 Số C4 - Trang 7457-7466 - 1994
Các kỹ thuật tỷ lệ màu được sử dụng để suy diễn nồng độ chlorophyll từ dữ liệu bức xạ của máy quét màu vùng nước ven biển (CZCS) không hiệu quả ở những vùng có nồng độ vật chất lơ lửng và gelbstoff cao (thường được định nghĩa quang học là nước loại II). Để xem xét tất cả các thành phần nước làm biến đổi trường bức xạ phản xạ cũng như độ bức xạ của đường đi khí dung, một kỹ thuật mô hình hồ...... hiện toàn bộ
Mô hình hồi quy tuyến tính tổng hợp ngẫu nhiên: một bộ dự đoán kết hợp chính xác và dễ diễn giải Dịch bởi AI
BMC Bioinformatics - - 2013
Tóm tắt Đặt vấn đề Các bộ dự đoán kết hợp như rừng ngẫu nhiên thường có độ chính xác vượt trội nhưng dự đoán của chúng khó giải thích. Ngược lại, mô hình hồi quy tuyến tính tổng quát (GLM) rất dễ diễn giải, đặc biệt khi sử dụng lựa chọn đặc trưng tiến tiến để xây dựng mô hình. Tuy nhiên, lựa chọn...... hiện toàn bộ
#mô hình hồi quy tuyến tính tổng quát #rừng ngẫu nhiên #dự đoán kết hợp #độ chính xác cao #giải thích dễ dàng.
Một khung làm việc chính quy để mô hình hóa và xác thực các sơ đồ Simulink Dịch bởi AI
Formal Aspects of Computing - Tập 21 Số 5 - Trang 451-483 - 2009
Tóm tắt Simulink được sử dụng rộng rãi trong ngành công nghiệp để mô hình hóa và mô phỏng các hệ thống nhúng. Với việc sử dụng ngày càng tăng của các hệ thống nhúng trong các tình huống an toàn thời gian thực quan trọng, Simulink trở nên thiếu khả năng phân tích yêu cầu (thời gian) với độ tin cậy cao. Trong bài viết này, chúng tôi áp dụng Tính toán Khoảng thời gian...... hiện toàn bộ
#Tính toán Khoảng thời gian Thời gian #Simulink #hệ thống nhúng #xác thực chính quy #mô hình hóa #ngôn ngữ đặc tả thời gian thực
Tổng số: 236   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 10